排序方式: 共有110条查询结果,搜索用时 15 毫秒
101.
102.
103.
对计算流体力学(Computational Fluid Dynamics, CFD)程序CNS提出一种Offload模式下对任务内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格-库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在"CPU(Intel Haswell Xeon E5-2670 12 cores×2)+加速器(Xeon Phi 7120A×2)"的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升至5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速至1.27倍,使用双加速器加速至1.45倍。讨论和分析了性能瓶颈与存在的问题。 相似文献
104.
美军网络空间司令部司令首次承认,美军网络战部队正在开发进攻作战能力。凭借在技术、人员和经验上的绝对优势,美军网络战部队一旦发动攻击,必将产生巨大的破坏力。一、美国透露网络进攻战战法此前,美国一直把其网络空间司令部统领下的网络战部队打扮成保护美国网络安全的"卫士"形象,但在2008年4月4日于纽约进行的信息官员协会会议上, 相似文献
105.
106.
对计算流体力学(CFD)程序CNS提出一种Offload模式下基于内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在“CPU(Intel Haswell Xeon E5-2670 12 cores ×2)+加速器(Xeon Phi 7120A ×2)”的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速1.27倍,使用双加速器加速1.45倍。讨论和分析了性能瓶颈与存在的问题。 相似文献
107.
108.
GPU异构系统中的存储层次和负载均衡策略研究 总被引:2,自引:1,他引:1
GPU体系结构的革新和相应开发平台的发展使得GPU广泛地应用于科学计算领域.通过深入地分析GPU体系结构和存储层次的优缺点以及GPU上的关键性能特征,阐明了GPU体系结构、编程模型和存储层次之间的关系.针对GPU异构系统上的应用映射提出三种基本负载均衡优化策略:预取、流化、任务划分.试验结果揭示了不同的优化因子与优化效率之间的具体关联. 相似文献
109.
根据嵌入式火控软件的数据特点 ,设计了相应的划分测试原则。并以某型坦克火控软件的实验数据对比了划分测试与随机测试的覆盖率 ,总结出对于该类软件划分测试具有一定的优势 相似文献